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摘要 蛋白质 糖 基 化 (glycosylation) 是 最 常见 和 最 重要 的 翻译 后 修饰 之 一 ， 大 规模 N- 连接 糖 基 化 位 点 鉴定 是 糖 蛋白 质 组 学 研 
究 的 重要 组 成 部 分 ， 而 N- 连接 糖 肽 富 集 是 高 通 量 N- 连接 糖 基 化 位 点 鉴定 的 关键 步骤 儿 集 素 富 集 法 和 栈 肝 化 学 法 是 目前 被 
广泛 应 用 的 N- 连接 糖 肽 富 集 技 术 ， 有 报道 认为 两 种 方法 具有 很 强 的 互补 性 ， 联 合 使 用 能 提高 糖 基 化 位 点 的 鉴定 数目 ， 本 文 
以 HepG2 细胞 系 为 模型 ， 系 统 比较 了 这 两 种 方法 的 富 集 效率 和 糖 蛋白 鉴定 数目 ， 结 果 表 明 ， 虽 然 酰 腓 法 的 糖 肽 富 集 效 率 为 
76.6%， 远 高 于 凝集 素 法 的 $4.6%， 但 是 凝集 素 法 却 能 鉴定 到 825 个 糖 蛋 白 和 1 959 个 N- 连接 糖 基 化 位 点 ， 显 著 多 于 醚 肘 法 
语 集 到 的 522 个 糖 蛋白 和 1 014 个 糖 基 化 位 点 ， 并且， 两 种 方法 并 未 显示 出 显著 的 互补 性 ， 仅 28 个 糖 蛋 白 和 80 个 糖 基 化 位 
点 未 在 凝集 素 法 中 鉴定 到 . 
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等 都 起 着 重要 作用 ， 并 参与 受 体 激 活 、 信 和 号 转 导 、 0 ERA I. WRAAE Fl 
细胞 - 细胞 相互 作用 等 诸多 重要 的 生物 学 过 程 上 ， 或 糖 肽 糖 链 上 的 顺 式 邻 二 羟基 结构 (cis-diols) 与 高 矶 
高 通 量 鉴 定 N- 连接 糖 重 白 以 及 糖 基 化 位 点 是 糖 蛋 。 酸 反 应 生成 醛 ， 醛 基 在 与 酰 脐 树脂 上 的 氨基 反应 形 
白质 组 学 研究 的 重要 组 成 部 分 ， 尽 管 超过 50% 的 ”成 共 价 的 腺 键 ， 从 而 被 酰 肝 树 脂 捕获 ，PNGase 下 
哺乳 动物 蛋白 质 发 生 了 糖 基 化 ， 然 而 糖 基 化 肽 段 仅 。 ” 酶 将 糖 肽 从 酰 及 树脂 上 释放 ， 得 到 富 集 后 的 糖 基 化 
占 到 和 蛋白质 酶 解 肽 段 的 2%~5% 昌 ,对 于 复杂 的 生 IRE. 2012 年 ，Sudhir 等 运用 酰 脐 化 学 富 集 法 在 
物 样本 ， 蛋 白质 含量 动态 范围 宽 ， 大 量 高 丰 度 非 糖 。 人 支气管 上 皮 细 胞 (HBECs) 中 鉴定 到 了 317 个 N- 
基 化 修饰 蛋白 的 存在 ， 使 得 低 丰 度 糖 基 化 修饰 蛋白 ”连接 糖 蛋白 含 608 A N- 连接 糖 基 化 位 点 ， 凝 集 素 
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检测 更 加 困难 ， 另 一 方面 ， 就 同一 蛋白 来 说 ， 糖 基 法 是 通过 凝集 素 选 择 性 地 识别 菜 些 特殊 结构 的 单 糖 
化 位 点 和 修饰 有 着 高 度 的 不 均一 性 ， 增 加 了 糖 基 化 ”或 聚 糖 实 现 对 糖 蛋白 的 富 集 ， 不 同 糖 型 的 糖 肽 可 以 
肽 段 检测 的 复杂 度 ， 因 此 ， 必 须 对 糖 蛋白 或 糖 肽 进 ” 采用 不 同 的 凝集 素 富 集 ， 刀 豆 凝 集 素 (convalina 


行 富 集 以 提高 检测 灵敏 度 , agglutinin, Con A) 富 集 高 甘露 糖 型 的 糖 肽 、 麦 胚 凝 

在 N- 连接 糖 重 白质 组 学 研究 中 ， 通 常 先 将 蛋 集 素 (wheat germ agglutinin, WGA) 富 集 末端 含有 

白质 样品 酶 解 成 肽 段 后 进行 糖 肽 富 集 ， 再 用 N- 乙酰 氨基 葡萄 糖 和 唾液 酸 的 糖 肽 、 草 麻 凝 集 素 

PNGase F 酶 切除 糖 肽 上 的 糖 链 ， 此 时 糖 基 化 修饰 (ricinus communis agglutinin I ，RCA120) 能 富 集 末 

的 天 冬 酰 胺 残 基 转 化 为 天 冬 氮 酸 并 产生 +0.984Da 

的 质量 偏 移 ， 经 液 相 色 谱 - 串联 质谱 分 析 后 ， 以 天 * 国家 重点 基础 研究 发 展 计划 (973)(2012CB966803, 2010CB833703) 
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端 含有 B1，4- 连接 半 乳 糖 的 糖 肽 、 橙 黄 网 胞 盘 菌 
让 aurantia lectin, AAL) AG E RA VE HF 
RAFIK, JERE E Er A AEA 
agglutinin，SSA)、 黑 接骨 木 凝集 素 (sambucus nigra 
agglutinin，SNA)、 怀 槐 凝集 素 (maackia amurensis 
lectin，MAL) 都 能 富 集 唾液 酸 的 糖 肽 .Mann 研究 
团队 中 联合 使 用 3 种 凝集 素 (ConA. WGA 和 
RCA120)， 利 用 超 滤 辅助 的 样本 制备 方法 (filter 
aided sample preparation，FASP)， 对 小 鼠 的 血浆 
脑 、 肾 脏 、 肝 脏 、 心 脏 组 织 的 N- 连接 糖 基 化 位 点 
进行 了 全 面 的 解读 ， 共 鉴定 到 来 自 2352 个 糖 蛋 白 
的 6367 个 N- 糖 基 化 位 点 ，Kaiji 等 外 使 用 5 种 凝 
集 素 (ConA、RCA120、WGA、AAL 和 SSA) 并 优 
化 了 不 同 凝 集 素 的 组 合 ， 同 时 结合 杀 水 相互 作用 色 
谱 法 (Amide-80)， 同 样 对 小 鼠 的 多 种 组 织 进 行 检 
测 ， 富 集 到 2 556 SHR AA 5 657 个 糖 基 化 位 
xà. BELGA REE AT N- 连接 的 糖 和 蛋白 的 
富 集 原理 不 同 ， 一 些 研究 将 两 种 富 集 方法 联合 使 
用 ， 并 显示 出 一 定 的 互补 性 ， McDonald 等 中 只 采 
] 凝 集 素 MAL 在 HeLa 细胞 膜 上 富 集 到 45 个 糖 基 
(OEE A, PPR eS EB] 56 个 糖 基 化 重 白 ， 两 种 方 
法 共 鉴 定 到 73 MOREE. Song 等 上 四 联合 两 种 方法 
在 食道 癌 病 人 的 血浆 中 共 鉴 定 到 139 SHAR, H 
中 两 种 方法 共同 鉴定 到 的 糖 蛋 白 数目 仅 为 59 个 . 
本 文 用 酰 腓 法 和 多 种 凝集 素 富 集 法 对 HepG2 细胞 
ABS N- 连接 糖 肽 进行 了 富 集 ， 利 用 LTQ Oribtrap 
XL 串联 质谱 鉴定 到 825 个 N- 连接 糖 蛋 白 相 对 应 
1959 糖 基 化 位 点 ， 结 果 显 示 凝 集 素 富 集 法 基本 上 
履 盖 了 酰 肘 化 学 富 集 法 鉴定 到 的 N- 连接 糖 和 蛋白 和 
糖 基 化 位 点 . 
1 实验 部 分 
1.1 实验 试剂 和 仪器 

RRRA (NalO,). BENET NG (hydrazide resin) 
W É Bio-Rad 2: *](Hereules, CA, USA). WiZ Ek 
胺 (iodoacetamide, IAA),  — Wi oy HF B 
(dithiothreitol, DTT). PRR, KR. BJ EE 
WW Sigma ZH] (Milwaukee, WI, USA). [5]4H2& 
HY KE Oasis HLB 购 自 美国 Waters 公司 (Milford, 
USA)， 糖 肽 内 切 酶 PNGase F(500U/wL) i A New 
England Biolabs 公司 ( Ipswieh，MA，USA )， 测 序 
级 胰 和 蛋白 酶 购 自 Promega 公司 (Madison, WI, 
USA). 测序 级 蛋白 酶 Lys C JW A Wako 公司 
(Osaka, Japan). Con A. WGA 和 RCA 120 JW É 
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Vector labs 2} H](Burlingame, CA, USA). 

PolySULFOETHYL A 强 阳离子 交换 (SCX) 固 相 
EHV ENA A PolyLC 公司 (Columbia, MA, USA). 
实验 室 自制 的 捕 集 柱 和 分 析 柱 填料 (C18 Kinetex 
2.6 uum) H F Phenomenex 公司 (Torrance，CA， 
USA). 24 Ft WE JH € Wf Nano LC ID plus JW A 
Eksigent 2: 7] (Redwood, CA, USA). 线性 离子 阱 
fF 电场 轨道 阱 质谱 仪 (LTQ-Orbitrap XL) JW A 
Thermo 公司 (Bremen，Germany). 
12 样品 制备 

HepG2 细胞 采用 青霉素 链 霉 素 双 抗 的 DMEM 
培养 基 ，37C ，5% CO, 恒温 培养 箱 培养 . 待 生长 
到 超过 培养 下 90% 时 ， 用 1 ml 10 mmol/L PBS 
(pH 7.5) 清 洗 3 次 ， 然 后 加 入 1 ml 裂解 液 ( 含 7 mol/L 
尿素 和 2 mol/L 硫 脲 )， 冰 上 微 摇 裂 解 ， 超 声 破碎 ， 
离心 去 除 沉淀 ， 用 Bradford 法 测定 蛋白 质 浓度 ， 
ae 冰箱 备用 . HX 12 mg 蛋白 样品 加 入 
终 浓 度 10 mmol/L 二 令 苏 糖 醇 (DTT)， 室 温 下 振荡 
反应 45 min， 进 行 蛋 白质 二 硫 刍 还原; 然后 加 入 
30 mmol/L 而 乙酰 胺 (IAA)， 于 室温 和 避 光 条 件 下 
WA 45 min， 使 统 基 烷 基 化 ， 待 反应 结束 后 向 溶液 
加 入 DTT 至 终 浓 度 5 mmolL 以 除去 过 量 的 IAA; 
按 蛋 白 酶 与 蛋白 1 : 200 的 质量 比 加 入 Lys C, 
370C 酶 解 2h， 用 50 mmol/L NHjHCO, 缓冲 液 溶解 
稀释 4 倍 ， 按 和 蛋白酶 与 蛋白 1 : 100 的 质量 比 加 入 
Trypsin, 37°C 酶 解 过 夜 ， 酶 解 液 经 Oasis HLB 柱 
脱盐 . 
1.3 强 阳 离子 交换 (SCX) 小 柱 预 分 离 

将 上 述 脱 盐 后 的 多 肽 混合 样品 用 SCX 小 柱 预 
分 成 9 个 组 分 . 流程 如 下 : 先 用 7 mmol/L 
KEHPO:、30% Z HS (ACN) 22 Tt WE (pH 2.65) 润 洗 
SCX [B HAS HEE, SRE 12 mg 多 肽 混合 样品 反 
复 3 次 上 样 ， 再 分 别 用 含有 10. 20. 30. 40. 60. 
90 和 350 mmol/L KCl 及 7 mmol/L KH;PO,. 30% 
ACN 的 缓冲 液 (pH 2.65) 依 次 洗 脱 并 收集 相应 的 组 
ay. WAIN A SARE A ZH. FR 
Oaiss HLB 柱 脱 盐 ， 
14 凝集 素 富 集 

将 预 分 各 组 分 肽 段 分 别 溶解 在 500 hl 50 mmol/L 
NH.HCO; 溶液 中 ， 然 后 加 入 ConA, WGA 和 
RCA120 三 种 凝集 素 侦 联 的 琼脂 糖 颗 粒 ， 在 4C 下 
i A 1h; 用 500 wl 含有 50 mmol/L NH.HCO; 的 
10% ACN 溶液 洗 凝 集 素 颗 粒 3 次 ， 除 去 非特 异性 
吸附 肽 段 ， 再 用 200 ul 50 mmol/L NH,HCO, 重 悬 
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凝集 素 颗 粒 ，100C 加 热 5 min 后 收集 上 清 ， 并 加 
入 1 wl PNGase F H£(500U/uI), TE 37C FIFRA 4h 
后 离心 收集 脱 糖 基 化 的 肽 段 . 
15 MiB 

将 预 分 的 各 组 分 肽 段 分 别 溶 解 于 500 ul 偶 联 
d Wil (100 mmol/L E25, 150 mmol/L, 
pH 5.5); 加 入 新 鲜 配 制 的 高 碘 酸 钠 ， 使 其 终 浓 度 为 
10 mmol/L, KRM 1h; 加 入 新 鲜 配 制 的 亚硫酸钠 ， 
使 其 终 浓 度 为 20 mmol/L， 振 荡 反 应 10 min， 消 耗 
过 量 的 氧化 剂 ， 向 肽 段 溶液 中 加 入 已 用 偶 联 绥 冲 液 
润 洗 5 iU B. E 37°C 条 件 下 进行 偶 联 反 
应 ， 振 荡 12h 使 树脂 与 溶液 充分 混合 ; 依次 用 
1 ml 1.5 mo/LS& YAK. 10096 AMES Gis All 
50 mmol/L NH.HCO, 各 清洗 3 次 以 洗 去 树脂 上 的 非 
特异 吸附 肽 段 ， 加 入 100 wl 50 mmol/L NH,HCO, 
溶液 和 1 pl PNGase F(S00U/ul, 7E 37C FA 
4 h 后 离心 收集 脱 糖 基 化 的 肽 段 . 
1.6 ” 糖 基 化 位 点 假 阳 性 率 的 测定 

为 了 评估 酶 解 、 富 集 和 脱 糖 过 程 中 化 学 脱 氨 对 
糖 基 化 位 点 鉴定 的 影响 ， 我 们 分 别 对 凝集 素 法 和 酰 
腓 法 进行 了 假 阳性 率 分 析 ， 采用 相同 的 HepG2 酶 
解 样 品 ， 与 前 面 描述 的 富 集 方 法 类 似 ， 只 是 凝集 素 
富 集 时 糖 肽 不 采用 PNGase F Ah, WERE S RRT 
多 肽 不 经 过 高 磺 酸 氧化 处 理 吗 ， 这 样 得 到 的 多 肽 不 
具有 糖 基 化 位 点 ， 而 具有 NXS/T(x AP) FP FEE TE 
多 肽 属于 化 学 脱 氮 肽 段 . 这 些 具 有 NxS/T(x PH 
基 化 序列 特征 的 化 学 脱 氮 肽 段 与 具有 NxS/T ¥ P) 
序列 特征 正常 富 集 到 的 糖 基 化 肽 段 的 百分比 即 为 糖 
基 化 位 点 的 假 阳 性 率 . 
1.7 NanoHPLC-MS/MS 分 析 
将 富 集 后 的 肽 段 以 2 pl /min 流速 上 到 捕 集 柱 
(20 mmx150 pm)， 再 用 250 nl/min 流速 洗 脱 到 分 
析 柱 (15 cmx75 pm) 分 析 . 色谱 条 件 为 : 流动 相 A, 
0.5% 甲酸 (FA) 水 溶液 ， 流动 相 B，0.5% FA I Gis 
AR. 色谱 梯度 为 : 0 min(0%B)-10 min(12%B)- 
140 min (33% B)-155 min (10096 B)-165 min (100% 
B). 串联 质谱 采用 线性 离子 阱 静电 场 轨道 阱 质谱 仪 
(LTQ-Orbitrap XL)， 一 级 质谱 采用 Orbitrap 检测 ， 
分 辨 率 m/z 400 处 为 60 000; 采集 质量 范围 m/z 
300~~2000， 依 次 选取 一 级 质谱 中 离子 强度 最 强 的 
10 个 离子 进行 CID 二 级 串联 质谱 分 析 . 
L8 ”数据 库 检 索 及 功能 分 析 

质谱 原始 数据 用 Maxquant 1.3.05 中 进行 检索 ， 
数据 库 为 UniProt 人 类 蛋白质 数据库 (版 本 2012 年 


11 月 ，89601 条 蛋白 序列 )， 数 据 库 搜索 参数 为 : 
级 谱 中 母 离子 质量 误差 为 t20， 二 级 谱 中 碎片 离 
子 质 量 误 差 为 +0.8Da， 酶 为 胰 重 和 白 酶 (trypsim)， 完 
全 酶 切 ， 漏 切 数目 为 2 个 ， 固 定 修饰 为 半 胱 氨 酸 的 
烷 基 化 (C，+57.02150Da)， 可 变 修饰 为 天 冬 氨 酰胺 
脱 栈 胺 基 (N，+0.98402Da) 和 甲 硫 氨 酸 的 氧化 (M， 
+15.99492Da). PSM (peptide spectrum match). 肽 
段 、 蛋 白质 和 天 冬 氨 酰 腕 脱 酰 腕 基 位 点 的 假 阳 性 率 
均 控制 在 1%， 鉴 定 肽 段 的 最 小 长 度 为 6 个 氨基 
R. 当天 冬 酰胺 的 脱 酰 胺 基 肽 段 符合 NXS/T(x ze P) 
序列 特征 ， 被 确认 为 N- 连接 糖 基 化 肽 段 ， 糖 蛋白 
的 GO 和 KEGG 功能 分 析 采 用 Persus1.3.0.4 软件 . 
2 结果 与 讨论 
2.1 实验 设计 策略 

本 研究 考察 凝集 素 宣 集 法 和 酰 腓 化 学 法 对 N- 
连接 糖 肽 的 富 集 差异 时 ， 首 先 对 HepG2 细胞 系 多 
肽 酶 解 产 物 用 强 阳 离子 交换 小 柱 预 分 ， 再 分 别 对 各 
个 组 分 富 集 ， 从 而 大 规模 的 获得 糖 肽 .如 图 1 所 
示 ， 肽 段 在 预 分 前 和 预 分 后 进行 了 HLB Miik, BE 
减少 盐 离 子 对 糖 肽 富 集 的 影响 ， 又 有 助 于 强 阳 离子 
交换 柱 的 分 离 ， 然而 ， 糖 基 的 亲 水 性 导致 部 分 糖 肽 
的 杀 水 性 增强 ， 在 ALB 保留 减弱 . 因此 ， 本 研究 
也 将 预 分 前 HLB 脱盐 的 流 穿 液 (flow through) fF y 


HepG2 cells 
Cell s digests 
| HLB desalting 
| SCX SPE fractionation 
| HLB desalting 


m. -~ 


p) IN TS 
| Oxidation 


pe | whe Peptides Peptides 


| — Con A, RCA120, WGA 


Couplin 
~ Hydrazide beads 
| ><PNGase F PNGase Fo“ | 


I A Deglycopeptides Deglycopeptides AY AY 
Ya nd RW 


| | 


LC-LTQ Oribtrap analysis LC-LTQ Oribtrap analysis 


Fig.1 A schematic overview of lectins (left) and 
hydrazide chemistry (right) based enrichment 
methods for N-linked glycoproteomics 
The lysates of HepG2 cells were tryptic digested, then desalted with 
Oasis HLB column and separated into 9 fractions by SPE-SCX. Each 
fraction was quartered and enriched by hydrazide chemistry and lectins 
respectively. Enriched N-glycopeptides were digested with PNGase F to 

remove glycans and then analyzed by LTQ Orbitrap XL. 
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一 个 组 分 HLB-FT， 连 同 SCX 流 穿 液 (flow through) 
组 分 SCX-FT, SCX 预 分 离 的 7 个 组 分 10、20、 
30、40、60、90 和 350 mmol/L KCl， 分 别 进行 了 
凝集 素 法 和 酌 肝 法 两 次 重复 富 集 .凝集 素 法 按 一 定 
比例 联合 使 用 ConA、WGA 和 RCA120 = BEES 
素 ， 能 够 特异 性 地 富 集 高 甘露 、N- 乙酰 氨基 葡萄 
糖 和 唾液 酸 、B1, 4- 连接 半 乳 糖 等 不 同 糖 型 的 糖 
肽 ， 提 高 糖 蛋 白 的 鉴定 种 类 . 栈 及 化 学 法 富 集 时 采 
用 经 典 的 富 集 步 又 ， 两 种 方法 富 集 得 到 的 糖 肽 均 用 
PNGase F 切除 糖 链 ， 采 用 LTQ Orbitrap XL 高 精度 
质谱 150 min 有 效 梯度 检测 . 采用 Maxquant 软件 
分 析 ， 并 筛选 含有 NxS/T 序列 特征 的 位 点 作为 N- 
连接 糖 基 化 位 点 . 
2.2 ”凝集 素 法 和 酰 有 午 法 鉴定 糖 基 化 位 点 数目 的 比较 
EAE TE APE o SE E f SU 853 个 N- 连接 
糖 蛋 白 和 1 959 个 糖 基 化 位 点 .如 图 2a 所 示 ， 采 
用 三 种 凝集 素 联合 富 集 的 方法 鉴定 到 了 3 047 个 天 
冬 酰胺 脱 酰 腕 基 修 饰 肽 段 合 计 2 507 SBE br 
点 ， 其 中 具有 NxS/T(x 径 P) 序 列 特征 的 糖 基 化 位 点 
1 879 个 ， 匹 配 到 825 个 糖 蛋白 ， 而 栈 腓 化 学 法 仅 
鉴定 到 1 346 个 天 冬 酰胺 及 酰胺 基 修 饰 肽 段 合计 
1320 个 脱 酰胺 基 位 点 ， 其 中 1 014 个 为 糖 基 化 位 
点 ， 对 应 522 个 糖 蛋白 . 无 论 是 天 冬 酰胺 脱 酰 胺 肽 
段 和 脱 酰 胺 位 点 ， 还 是 糖 基 化 蛋白 和 糖 基 化 位 点 ， 
凝集 素 富 集 法 鉴定 的 数目 均 高 于 酰 肝 法 .在 所 鉴定 
E A B Jb P Br ns KA 25% 的 位 点 不 符 
合 NxS/T(x A PIETARI. 是 由 于 在 Trypsin 


AF 


® 3500| 3047 


和 PNGase F 的 碱 性 酶 解 反 应 条 件 下 ， 天 冬 酰 腕 (N) 
会 自发 脱 酰胺 中， 这 些 脱 酰胺 位 点 在 凝集 素 法 或 酰 
腓 法 的 富 集 过 程 中 作为 非特 异性 吸附 而 被 质谱 检测 
到 ,为 了 检测 自发 脱 氨 对 糖 基 化 位 点 鉴定 的 影响 ， 
我 们 采用 Palmisano 等 外 提出 的 计算 方法 对 凝集 素 
法 和 酰 腓 法 进行 了 假 阳 性 率 分 析 ， 其 中 凝集 素 法 未 
经 过 PNGase F 酶 处 理 ， 鉴 定 到 114 个 脱 氮 位 点 ， 
23 个 位 点 具有 NxS/T(x 关 P) 糖 基 化 序列 特征 ， 假 阳 
性 率 为 1.22%(23/1 879). BEBE: ZR ZS PNGase F 酶 
处 理 ， 得 到 了 55 个 脱 氮 位 点 含有 8 个 具有 NxS/T 
(x 堵 P) 特 征 序列 的 位 点 ， 假 阳性 率 为 0.79%(8/1 014). 

本 研究 中 ， 小 集 素 法 富 集 的 糖 基 化 位 点 数目 
1 879 个 不 仅 比 酰 有 讲法 富 集 糖 基 化 数目 1014 个 多 
Ir—1f5, MAB HT 95.9% 的 总 糖 基 化 位 点 数 ， 
仅 有 80 个 糖 基 化 位 点 是 酰 腓 法 特异 鉴定 到 的 (网 2b). 
在 糖 蛋白 水 平 具有 相同 的 结论 ， 凝 集 素 鉴 定 到 的 
蛋白 数目 涵盖 了 超过 9%6.7% 总 糖 蛋 白 ， 仅 有 28 
个 糖 蛋白 是 在 凝集 素 法 未 鉴定 到 的 (图 2， 而 
McDonalde 曾 报道 凝集 素 富 集 法 和 栈 肝 化 学 富 集 法 
具有 一 定 的 互补 性 上 四， 在 HeLa 细胞 中 共 鉴 定 到 
127 个 N- 连接 糖 基 化 位 点 ， 其 中 凝集 素 法 富 集 鉴 
定 到 76 个 位 点 ， 酰 肝 法 富 集 鉴 定 了 75 个 .导致 不 
结论 的 原因 可 能 与 McDonalde 使 用 单 凝 集 素 
(MAD) 富 集 策略 有 关 . 本 研究 采用 了 ConA, WGA 
和 RCA120 三 种 凝集 素 联 合 富 集 ， 同 时 辅 以 SCX 
预 分 ， 因 此 最 大 限度 地 提高 了 雍 集 素 法 富 集 鉴 定 糖 
肽 的 数目 . 


1 959 glycosites 


853 glycoproteins 


Fig. 2 Summary of the results from lectins and hydrazide based enrichment methods 


(a) The number of deamidated peptides, deamidated sites, deamidated NxS/T (x 7& P) sites and glycoproteins in lectins (blue) and hydrazide chemistry 


(red) based enrichment methods. 7: Deamidated peptides; 2: Deamidated sites; 3: Deamidated sites with NxS/T motif; 4: Glycoproteins. Bl: Lectins; 


E : Hydrazide. (b) Overlap of glycosites between lectins and hydrazide chemistry enrichment methods. (c) Overlap of glycoproteins between lectins 


and hydrazide chemistry enrichment methods. 
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图 3 显示 ， 在 所 鉴定 的 3 051 个 N- 连接 糖 基 水平 ， 含 有 1 个 、2 个 、3 个 和 4 个 糖 基 化 位 点 
化 肽 段 中 ， 只 有 1 个 糖 基 化 位 点 的 糖 肽 超过 80%， ”的 蛋白 质 则 分 别 占 44.3%、20.0%、13.4% 和 6.5% 
2 个 糖 基 化 位 点 的 糖 肽 约 占 14%，3 个 及 以 上 糖 基 (图 3b)， 与 Zielinska 等 1 报道 的 结果 基本 一 致 . 
化 位 点 的 糖 肽 不 足 2.5%( 图 3a)， 而 在 整个 蛋白 质 
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Fig. 3 Distribution of single and multiple glycosylated peptides and identified by lectin 
and hydrazide chemistry enrichment methods proteins 
(a) Distribution of single and multiple glycopeptides. (b) Distribution of single and multiple glycosylated proteins. 


2.3 EER AMARAH A BR LER 留 ， 使 得 强 亲 水 性 糖 肽 富 集 于 HLB 流 穿 液 中 ， 而 
糖 基 化 肽 段 的 富 集 效率 是 指 鉴定 到 的 糖 基 化 修 ”含有 唾液 酸 的 酸性 糖 肽 在 SCX 柱 上 不 保留 或 保留 
饰 肽 段 占 所 有 检测 肽 段 的 百分比 . 如 图 4a 所 示 ， 较 弱 ， 因 此 在 SCX-FT 和 10 mmol/L KCI 两 个 组 分 
HLB-FT. SCX-FT 及 10. 20. 30. 40. 60. 90% ”中 也 有 较 高 的 含量 ， Lewandrowski 等 四 利用 该 原 
350 mmo/L KCI 等 9 个 组 分 ， 通 过 凝集 素 法 富 集 鉴 MAH SCX 直接 富 集 到 79 个 含 唾液 酸 的 糖 蛋 白 . 
定 的 糖 基 化 位 点 分 别 为 : 355、367、481、617、 如 图 4b， 栈 脏 化 学 法 的 9 个 组 分 富 集 效率 分 
818、649、497、615 和 507， 富 集 效率 分 别 为 : 别 为 59.4% 、81.3% 、 87.9%. 80960. 56.2% 、 
77.2%, 89.396. 87.696. 67.1%, 53.9%, 41.9%, 70.5%. 76.4%. 7095 78.6%， 平 均 的 富 集 效率 高 
51.4%、58.9% 和 44.9%. 平均 富 集 效率 为 54.6%， TK 76.6%， 栈 有 讲法 富 集 的 糖 基 化 位 点 数 比 凝集 素 法 
高 于 Zielinska 等 吊 报 道 的 45%， 值得 注意 的 是 低 ， 而 富 集 效率 却 明 显 高 于 凝集 素 法 . 这 可 能 是 本 
通常 被 忽略 或 丢弃 的 HLB 流 穿 液 (HLB-FT)、SCX 有 旱 法 的 缩合 反应 要 比 凝 集 素 业 的 亲 和 反 应 特异 性 更 
流 穿 液 (SCX-FTD， 以 及 低 盐 浓 度 洗 脱 (10 mmol/L ” rf, JPHRWIZEHPSEEZOK RIS A 23 EGER 
KCI 三 个 组 分 的 糖 肽 富 集 效率 显著 高 于 其 他 组 分 . 素 的 琼脂 糖 凝 胶 树 脂 非特 异 吸 附 更 低 ， 所 以 糖 基 人 
这 可 能 是 由 于 糖 基 化 肽 段 比 其 他 非 糖 基 化 肽 段 的 亲 ” 肽 段 语 集 效 率 高 ， 但 酰 脐 法 富 集 过 程 中 使 用 高 健 
水 性 较 强 ， 在 HLB 反 相 捕 集 柱 上 保留 较 弱 或 无 保 R, 会 造成 肽 段 的 酷 氨 酸 残 基础 化 及 其 他 一 些 化 学 


x 


Cw 


x b S 

(9 900| J 100.005, ©) 400} 1100.00 S, 

800 + E 350 E 

700 L 180.00 .2 300 180.00 .3 

5 = 5 = 

run 16000 § 2 250 160.00 & 

Z 300| 740.00 5 Z150 | 40.00 2 

200 - 120.00 5 100 120.00 4 

100r = 50r E E 

0 0.00 ji 0 0.000 & 
12 3 4 5 6 7 8 9 12 3 4 567 8 9 


Fig.4 Distribution and comparison of N-glycositess and enrichment efficiency in nine fractions 
(a) Lectin method. (b) Hydrazide chemistry method. 7: HLB-FT; 2: SCX-FT; 3: 10 mmol/L KCI; 4: 20 mmol/L KCI; 5: 30 mmol/L KCl; 6: 40 mmol/L 
KCI; 7: 60 mmol/L KCI; 8: 90 mmol/L KCI; 9: 350 mmol/L KCl. Wl: Glycosites; B 一 国 : Enrichment efficiency. 
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副 反 应 凶 ， 肽 段 因 修 饰 而 检索 率 降低 ， 因 此 糖 基 化 
BEES AE EH BU. 
2.4 ”N- 连 接 糖 基 化 位 点 序列 特征 分 析 

糖 基 化 位 点 序列 特征 统计 分 析 显 示 ，1 135 个 
糖 基 化 位 点 含有 NxT 特征 序列 ， 占 位 点 总 数 的 
57.9%, 824 个 糖 基 化 位 点 含有 NxS 的 特征 序列 ， 
占 位 点 总 数 的 42.1%， 这 与 Wuhrer 报道 相 一 致 呈 . 
应 用 WebLog TRI AERARII, REK 
8j NxT 序列 特征 出 现 频率 显著 高 于 NxS 的 出 现 频 


(a) 1959 


(b 1135 


(c) 824 


(d) 656 


率 ( 图 5a)， 糖 基 化 位 点 N 后 的 第 一 个 氨基 酸 x( 横 
坐标 为 1 )， 在 NxT 特征 序列 中 出 现 的 最 高 频率 是 
Ave V( 图 Sb)， 而 在 NxS 的 特征 序列 中 x 为 丝 
ZA NR S( 图 So)， 非 糖 基 化 的 脱 酰胺 基 肽 段 (图 5d) 与 
糖 肽 中 氨基 酸 频 次 不 同 ， 这 些 自 发 脱 酰 氮 天 冬 酰胺 
最 常 出 现在 甘氨酸 G、 天 冬 氨 酸 N 和 丝氨酸 S 之 
前 . 这 与 Hao 等 外 报道 的 -N-G-，-N-S- 和 -N-D- 
等 序列 特征 更 容易 在 碱 性 条 件 下 发 生 自 发 脱毛 相 


Fig. 5 Analysis of sequnence motif using WebLogo 


(a) N-glycosylated consensus sequence with N-x-S/T (X #P) motif, (b) N-glycosylated consensus sequence with N-x-T motif (c) N-glycosylated 


consensus sequence with N-x-S motif (d) Non-glycosylaited deamidated consensus sequence. 


2.5” 糖 蛋白 的 生物 信息 分 析 

本 研究 在 HepG2 细胞 中 鉴定 到 853 个 糖 蛋 白 ， 
其 中 593 个 在 UniProt 数据 库 中 注释 为 糖 和 蛋白 ， 
260 个 新 发 现 的 N- ERREA. 为 了 进一步 了 解 
糙 和 蛋白 的 总 体 功能 ， 我 们 进行 了 GO (gene 
ontology)slim 的 功能 分 析 ， 在 细胞 组 成 (cellular 
components) 方 面 ， 糖 蛋白 主要 集中 分 布 在 细胞 外 
基质 (17.24%)、 细 胞 质 膜 (10.67%)、 内 质 网 / 高 尔 
基体 (6.92%) 等 细胞 膜 相 关 体 系 (图 6a)， 而 在 生物 


等 生物 过 程 (图 6b)， 同 时 KEGG 通路 分 析 表 明 ， 
糖 蛋 白质 主要 参与 了 溶 酶 体 、 和 蛋白 质 内 质 网 加 工 、 
肿瘤 的 信号 转 导 、 细 胞 因子 相互 作用 、 否 哈 体 、 焦 
RABIN. ECM- 信号 转 导 和 细胞 荞 附 信号 转 导 通路 
(图 6c)， 糖 蛋白 与 细胞 表面 膜 蛋 白 高 度 相 关 ， 而 
细胞 表面 分 化 抗原 艇 (cluster of differentiation 
antigens，CDs) 是 一 类 非常 重要 的 细胞 表面 膜 相 关 
fk EUROS, ande 1 所 示 ， 我 们 共计 发 现 了 72 
个 人 类 CD 蛋白 检测 到 N- 连接 的 糖 基 化 位 点 .这 


Ti 


过 程 (biological processes) 7 Ift, ZR AEBS 5 


者 示 了 糖 基 化 修饰 对 CD 的 分 子 功能 、 识 别 和 免疫 


了 信号 转 导 (14.89%)、 转 和 运 (13.72%)、 和 蛋白 翻译 后 
修饰 (9.96%6)、 细 胞 符 附 (9.96%)、 免 疫 应 答 (8.32%0) 


言 号 的 传导 具有 重要 的 作用 . 
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Fig. 6 Distribution of glycoproteins based on functional categories 
(a) Cellular component. (b) Biological process. (c) KEGG. The number in (a) and (b) indicates the percentage of total glycoproteins belongs to a given 


functional category. The number in (c) indicates the number of identified glycoproteins in the given pathway. 


Table 1 CD molecules from all identified glycoproteins 


Gene ID Uniport ID CD name Gene ID Uniport ID CD name 
ABCBI P08183 CD243 ILI7RA Q96F46 CD217 
ABCG2 Q9UNQO CD288 IL6R P08887 CD126 
ADAMIO 014672 CD156c IL6ST P40189 CD130 
ADAMI7 P78536 CD156B INSR P06213 CD220 
ALCAM Q13740 CD166 ITGA1 P56199 CD49a 
ATP1B3 P54709 CD298 ITGA2 P17301 CD49b 
BCAM P50895 CD239 ITGAS P08648 CD49e 
BST2 Q10589 CD317 ITGAV P06756 CD51 
CD109 Q6YHK3 CD109 ITGB4 P16144 CD104 
CDI51 P48509 CDI51 LICAM F5H025 CD171 
CD164 Q04900 CD164 LAMPI P11279 CD107a 
CD276 Q5ZPR3 CD276 LAMP3 Q9UQVA4 CD208 
CD33 P20138 CD33 LIFR P42702 CD118 
CD36 P16671 CD36 LRPI Q07954 CD851 
CD44 P16070 CD44 MCAM P43121 CD 146 
CD47 Q08722 CD47 MFD P08582 CD228 
CD55 BIAPI3 CD55 MRC2 Q9UBGO CD280 
CD58 P19256 CD58 MSTIR Q04912 CD136 
CD59 E9PR17 CD59 NRPI 014786 CD304 
CD63 P08962 CD63 NTSE P21589 CD73 
CD68 P34810 CD68 PLAUR Q03405 CD87 
CD70 P32970 CD70 PRNP P04156 CD230 
CD82 P27701 CD82 PROCR Q9UNNS$ CD201 
CD97 P48960 CD97 PTGFRN Q9P2B2 CD315 
CDCP1 Q9HSV8 CD318 PTPRJ Q12913 CD148 
CDH2 P19022 CD325 PVR P15151 CD155 
CDH5 P33151 CD144 PVRLI Q15223 CD111 
CSFIR P07333 CD115 PVRL2 Q92692 CD112 
TNFRSFIA P19438 CD120a PVRL3 Q9NQS3 CD113 
EMR2 Q9UHX3 CD312 SEMA4D Q92854 CD100 
ERBB2 P04626 CD340 SEMA7A 075326 CD108 
F3 P13726 CD142 ILI3RAI P78552 CD213al 
FGFR4 P22455 CD307d TFRC P02786 CD71 
GGTI P19440 CD224 TLR6 Q9Y2C9 CD286 
IGFIR P08069 CD221 TNFRSFI1A Q9Y6Q6 CD265 
IGF2R P11717 CD222 


IGSF8 Q969P0 CD316 


EHI, 等 : 


凝集 素 法 与 酰 脐 法 富 集 糖 肽 的 方法 学 比较 
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本 文 以 HepG2 MARR, EC Y ER 
法 和 三 种 凝集 素 混 合 富 集 法 鉴定 N- 连接 糖 基 化 位 
点 数目 和 富 集 效率 ， 其 中 凝集 素 富 集 鉴定 到 1 879 
个 N- 连接 糖 基 化 位 点 、825 T BEER EUR. EAL, 

富 集 鉴定 到 1 014 个 N- 连接 糖 基 化 位 点 、522 
个 糖 蛋 白质， 两 种 富 集 方法 总 共 鉴 定 到 1 936 个 N- 
连接 糖 基 化 位 点 ，853 个 糖 蛋白 ， HERI ERE 
肽 富 集 时 表现 出 更 好 的 特异 性 ， 但 富 集 鉴定 糖 基 化 
位 点 的 数目 显著 低 于 凝集 素 法 ， 而 且 三 种 凝集 素 混 
合 富 集 鉴定 的 糖 基 化 位 点 和 糖 蛋白 几乎 涵盖 了 酰 及 
法 的 富 集 鉴定 结果 . 此 外 ， 在 利用 HLB 柱 脱盐 和 


SCX 柱 预 分 时 ， 其 流 穿 液 宣 含 糖 肽 ， 应 加 以 利用 . 
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Abstracts Glycosylation is one of the most common and important post-translational modifications of proteins. 
Identification of large-scale N-linked glycoprotein is a very important aspect in glycoproteomics research. The 
N-glycopeptide enrichment is a key step in high-throughput identification of N-glycosylation site. Lectin 
enrichment and hydrazide chemistry are the two widely used N-glycopeptides enrichment methods. Each method 
can only enrich certain types of glycopeptides. It has been reported that the two methods are highly 
complementary, but few studies compared overlaps of glycosties from the two methods. In this paper, using HepG2 
cells, we systematically compared the performance of hydrazide chemistry and lectins enrichment methods. The 
results showed that although the hydrazide method with glycopeptides enrichment efficiency of 76.7%, far higher 
than the 54.6% lectin enrichment method, 825 glycoprotein and 1 879 N-glycosylation sites identified with the 
lectin method was significantly more than 522 glycoprotein and 1 014 glycosylation sites enriched by the hydrazide 
method. Moreover, the two methods did not show significant complementary, together, only 853 glycoproteins and 
1 959 N-glycosylation sites were identified. The overlapping results of identified N-glycosylation sites and 
N-glycoproteins from the two methods show that lectins enrichment method was better than hydrazide chemistry 
method. 
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